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Использование арифметики многорозрядных 
чисел в современных компьютерных 
технологиях решения задач 
трансвычислительной сложности 


В работе приводится ряд оригинальных эффективных по быстродействию алгоритмов выполнения 
операций над многоразрядными числами и их применение для решения задач двухключевой криптографии и 
для высокоточных вычислений с помощью компьютерной технологии решения задач прикладной и 
вычислительной математики с заданными значениями характеристик качества по точности и быстродействию. 


Введение 


В настоящее время существует много прикладных задач: в двухключевой крипто- 
графии (шифрование, расшифрование, электронная цифровая подпись, криптографичес- 
кие протоколы), моделировании физических, химических (биохимических) процессов, 
аэродинамики, гидродинамики, расчета оболочек ядреных реакторов, при решении ко- 
торых активно используется арифметика многоразрядных чисел [1], [2]. 

Если раньше арифметика многоразрядных чисел в основном использовалась в 
двухключевой криптографии для обеспечения необходимой криптостойкости и про- 
изводительности соответствующих алгоритмов (для записи одного числа требуется 
от 1024 до 4096 бит), то в последние годы, в связи с появлением суперкомпьютеров 
и решением на них сверхсложных задач, область применения многоразрядной ариф- 
метики значительно расширилась. В последнем случае это связано с обязательным 
исследованием наследственной погрешности и погрешности округления, накаплива- 
емых в ходе длительных численных расчетов. Неучёт этих погрешностей приводит к 
тому, что иногда получают компьютерные решения, не обладающие физическим смыслом. 

Достоверность получаемых результатов в значительной мере зависит от чув- 
ствительности задачи к малым ошибкам округлений. Например, для системы линей- 
ных алгебраических уравнений понятия «хорошо и плохо обусловленная матрица» тес- 
но связаны с вычислительными возможностями конкретного компьютера и длиной 
машинного слова. В результате одна и та же система может квалифицироваться для 
одной длины мантиссы машинного слова как «машинно плохо обусловленная» или 
«почти вырожденная», а для другой — «машинно хорошо обусловленная» [3]. Таким 
образом, один из резервов для получения достоверного решения для плохо обуслов- 
ленных задач — повышение точности представления чисел и выполнения операций. 

Цель статьи — с одной стороны, привлечь внимание к существенному расшире- 
нию области применения многоразрядной арифметики, изложению новых эффективных 
алгоритмов выполнения операций над многоразрядными числами, а с другой — показать 
место этой арифметики (как одного из резервов оптимизации вычислений) в современ- 
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ных компьютерных технологиях решения задач дискретной, прикладной И ВЫЧИСЛИ- 
тельной математики с заданными значениями характеристики качества По точности и 
быстродействию [1]. 


| Некоторые новые эффективные по быстродействию 
алгоритмы выполнения операций над многоразрядными 
числами 

1.1 Построение алгоритмов вычисления 

многоразрядной свертки 


Постановка задачи. Если целые положительные числа (,,, Г/,, С’, вида 
М№› М> М 
М-1 | М-—1 | М-1 
—_ @ р @ ка @ 
= 2 р жи ой 
1=0 1=0 1=0 


где 0<и,,у,с,<2°, М = 2", тогда выражение С’ вида 
№— №Ь— №1 
С, =И, ВИ, =: ®[з" Ул", (1) 
1=0 1=0 т=0 
где с, = Уи › `У5 представляет собой циклическую свертку Их и Их. 
р-+ё=г(тоа №) 

Вычисление свертки с использованием быстрого преобразования Уолша 
(БПУ). Проиллюстрируем метод использования преобразования Уолша для вычисления 
сверток на примере вычисления свертки длины № =4. При этом достаточно выполнить 
5 операций умножения 


рт о Ь. 20. 4 Я 0 
от В: Е -1 =. 
Х. = 5 Х.= Й’, = ;4= , 
5 5 зе “ЦТ 0 
и. р 1-1 - 1 +2 
= (х — 2). (%% — У.) = жму +, — му) - У, Я = (И, -Х,) (7, -7,); 
1 
ВИ. № +Т,. (2) 


Результат (2) представляет собой циклическую свертку последовательностей Х, и 
У,: К, ЕХ, ®У.. Видно, что свертку длиной М =4 нельзя вычислить с использовани- 
ем только БПУ. Необходимо использовать корректирующий элемент {. Далее показано, 
что для вычисления более длинных сверток необходимо большее число корректирую- 
щих элементов. Последовательность всех корректирующих элементов можно предста- 
вить в виде корректирующего вектора Ти существует простой способ его построения. 

Операторы вычисления. Введем следующие операторы Е, О, Г, Н, (0, О, И’, 4, 5, 
(Е-Еуеп (четный), О-ОЧ4 (нечетный), [-Гом? (младшие), Н-Нй (старшие), (-Цр (вверх), 
Р-Бомт (вниз), И’-И’абй (Уолш), А-АЧА (добавление), 5-биБМгасЕ (вычитание) и опре- 
делим их следующим образом: 


(ЕХ»), =%>,, (ОХ), И, =х,, (НХ), = Хм › к =0,№/2 —1; 


циклический сдвиг элементов вверх Г», =ИХу, у, = Жи? К =0, М-1; 
м 
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циклический сдвиг элементов вниз Г, =ДОХу, у, = Хин), › К =0,М-1; 
М 

циклический сдвиг элементов вверх р раз Г, =И? ре в 

циклический сдвиг элементов вниз р раз И, =0? (Хх е 

Проиллюстрируем вид операторов для случая №М=8: 
№ 1 № ^ У Уз 
х ье х х 

о о 2 ‚Ви = % 
№ № х› № Уз У 
№ Х7 № 7 У У> 


Последовательное выполнение операторов О, И’, Н обозначим оператором 5, 
выполнение операторов О, И’, Ё —черезА: 


5х, =Н((ОХ)) = Е(ОХ „)- О(ОХь), 
АУ, = КИ(ОУ,)) = Е(ОУ,) + О(ОУ,). 


Вычисление свертки разрядностью / = 8 с использованием БПУ и с учетом вве- 
денных выше операторов можно выразить следующим образом: 


№=И.-Х,, Е=И, У, №, =1Х, -НЖ,, У, =И(ЕТ,)-ЕЪ, Е.И: 
&=Х,.Е, &=Х,-Е, Е =5Х, - АЕ, Е=5Х,.АЕ; 
А, =Й, -&, А, =, Я, 5 =И,.Е; 
ОА, =Од + А,, ОТ, =ОГ, +Т, 


Из приведенных формул видно, что для вычисления свертки разрядностью Л = 8 
необходимо вычислить три БПУ разрядностью М = 8, два БПУ разрядностью М =4, 
одно БПУ разрядностью М = 2, а также 15 операций однословного умножения. 

Теорема 1. Для вычисления свертки К, = Х, ®У, длиной М =2" с использова- 
нием алгоритма БПУ необходимо перемножить поэлементно два вектора длиной 
5.3"? каждый. 

Лемма 1. Количество операций сложения и вычитания для вычисления БПУ в 
векторе Х, разбитого на основные и дополнительные секции с длинами К, оценива- 


ется следующим соотношением О* = (10п + 4)3"* ‚где М=2”. 

Пошаговый алгоритм умножения двух чисел разрядностью №=2” через 
свертку, используя БПУ. Введем дополнительные обозначения. 

Х = (х 3 ) обозначает, что к элементам Х добавляются элементы Й справа. 
Соответственно длина Х’ увеличивается на число элементов вектора 7. 

х, обозначает 1-й элемент Х. При этом Х считается полнозаполненным без учета 


разбивки на секции разрядностью степени ДВОЙКИ. 
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(х ) обозначает, что в Х рассматривается 1-я секция. Элементами К являются 
длины секций Х’. Соответственно элемент А, содержит длину 1-й секции в Х. 
(х ), | обозначает, что в 1-й секции Х берется /-й элемент. Вектор К содержит 


длины секций в Х. 

(х и ). обозначает, что в векторе Х рассматривается 1-я секция. Считается, что 
Х разбит на секции равной длины М , где М - степень двойки, ф — пустой вектор. 

Последовательность операций разбивается символом «;», которые выполняются в 
обычном порядке слева направо. Операции внутри символа «;», разделенные запятой, 
выполняются в обратном порядке справа налево. Если операцию обозначить номером ее 
выполнения, то получим строку, представляющую последовательность выполнения 
операций: 2, 1; 6, 5, 4, 3; 8, 7. 

С учетом введенных обозначений опишем следующий алгоритм. 

Алгоритм 1. Реализация операции умножения двух чисел разрядностью М = 2" 
через свертку, использующую БПУ. 

Шаг 1. Предвычислить: 


5=9, К=(2"); $ = ($,27,5), К=(К, 


Добавить длины дополнительных секций: К = (К : 
Инициализировать: Х = (х ты =Ху; У= (у й | те 


0 
Шаг 2. БПУ начальной секции (х).: №, =Й’, Ху. 
Шаг 3. Представить ДПУ остальных секций Х’как линейных комбинаций секций Х’: 
х=(х,(Цх,)-Н(хи),), 1=0,37—1, М=2"/,у=0,и-3. 
Шаг 4. Вычислить БПУ секций У за исключением двух последних шагов. 


(у). =, У = (7, (((ЕТ)-ЕУ)),И =(7,),, #=0,37 —1, М =2” 7,1 =0,п-3. 


Шаг 5. Вычислить последние два шага БПУ. (у,) = (У, ) ‚1=0,3" 2—1; 


(#). =#(®),, ;=0,(2.3"?)-1. 
Шаг 6. Сформировать дополнительных секций Х = (х У ) ‚У= (У И ). 
Шаг 7. Вычислить. А =Х.У. 
Шаг 8. Вычислить ОБПУ. (К), =”, .(®),,1=0,№/2-1. 
Шаг 9. Вычислить начальные основные и дополнительные секции: 


(в), ны = (Виз =б,5 т = 0,15) -1,5=5,, 
1=072-9.-04 +1, 04-0. 


Шаг 10. Корректировать начальную основную секцию: 
аа > | ‚1 =0,№/4-—1; 
(к), ные ых Е | = 0, №/4 ы 


Лемма 2. Оценка общего числа операций сложения и вычитания в алгоритме 1 
определяется соотношением О* < п2” —11.2”? + (18п + 43)3" 3. 
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Теорема 2. Оценка количества вычислительных затрат, необходимых для вычисления 
свертки (1) с помощью алгоритма 1 на основе БПУ, может быть оценена соотношением 


О< О +Они › где От, < п2" 11.2"? + (18п + 43)3"* — оценка общего количества 
необходимых операций сложения и вычитания, О <5.3"? — оценка количества 


необходимых умножений (ГРИТ — Еа$+ \!а1$В шапзРогт). 

Ниже приведена табл. 1, содержащая число умножений, необходимых для вычи- 
сления циклической свертки различными алгоритмами (классическим, с исполь- 
зованием БПФ и алгоритмом 1 на основе БПУ). Известно, что для вычисления свертки 


стандартным методом необходимо выполнить порядка М№ операций умножения и 

сложения. Для косвенного алгоритма вычисления свертки А, с использованием алго- 

ритма БИФ асимптотические оценки количества необходимых умножений и сложений 

с плавающей точкой в случае №М=2”, п> 0 - целое, имеют соответственно вид [4], [5]: 
* = ре . 

Орг < 9п>2" ы О < 13, 5н*2” '(ЕЕТ- Еа$ Еоцнег тапзФогт). 


Оценки О*„; и О,„, определены теоремой 2. 


Таблица 1 

п От Он Отит От Отт 
5 1,024 720 135 1,080 1,287 
6 4,096 1,890 405 2,592 4,339 
7 16,384 4,032 1,215 6,048 14,395 
8 65,536 9,216 3,645 13,824 47,271 
9 262,144 20,736 10,935 31,104 154,103 
10 1,048,576 46,080 32,805 69,120 499,499 
И 4,194,304 101,376 98,415 152,064 1,611,219 
12 16,777,216 221,184 295,245 331,776 5,175,151 


Отметим, что Ор, Орг содержит число операций с плавающей точкой, О’, 
О*„г — число операций над целыми числами. На современных компьютерах опера- 


ции с плавающей точкой выполняются в 10 и более раз медленнее, чем операции над 
целыми числами. 

Отметим, что, как показал сравнительный анализ сложности, рассматриваемый ал- 
горитм 1 при и<11 требует меньше вычислительных затрат, чем алгоритм, использу- 
ющий БИФ. Поэтому его целесообразно применять для вычисления сверток разряд- 
ности М2. 

Коэффициенты ускорений д” и 6* по отношению к операциям действительного 
умножения и сложения для исследуемого алгоритма по сравнению с алгоритмом сек- 
ционирования на основе БИФ [4] имеет вид 

$ 9". 2" 13,5и.2"' 
а => 
5.3 2"(п-11/4)-+ (18п + 43)3 


гдев К =; / 1, 1,„1, — времена выполнения операции с плавающей точкой и время 
выполнения операции над целыми числами соответственно. А, =10. 


Ниже в табл. 2 приведены коэффициенты ускорения б’ид*. 
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Таблица 2 
п 2 3 4 5 6 7 8 9 10 п 12 
6” 72 72 64 53,3 | 42/7 | 33,2 | 25,3 | 18,9 | 14,0 | 10,3 | 7,49 
9* 23,1 | 16,4 | 11,8 | 8,51 | 6,05 | 4,25 | 2,95 | 2,04 | 1,39 | 0,95 | 0,65 
Анализ таблицы и предыдущие рассуждения показывают, что алгоритм 1 
целесообразен для вычисления свертки длиной М=2", и <11. 


Усовершенствованный метод Питасси — Девиса. Предлагается метод вычисления 
свертки разрядностью № =К.2”, где К- нечетное, который расширяет диапазон 
разрядностей, в котором существуют эффективные методы вычисления циклической 
свертки. Далее показано, что для сверток такой разрядности достаточно вычислить две 
свертки разрядностью К, в отличие от метода Питасси — Девиса, в котором на каждой 
итерации необходимо вычислять три свертки. При этом используется свойство нечет- 
ной разрядности: результат непарного циклического сдвига в одну сторону равняется 
парному сдвигу в другую сторону. 

Лемма 3. Для циклической свертки любой разрядности имеют место соотношения: 

ИХ, ®0Х,= ЛХ, ®У,,, 
Х,®ИУ, =И(Х, ®У,), 
ИХ, ®У, =Х, ®БУ,. 


В общем виде предлагаются формулы вычисления свертки разрядностью №=К-2", 
где К — нечетное, р=[К/2 |: 


Ах» = (Ех, +И*(ОХ,))®(ЕУ, +И?(0У,)) ЕВ, = И2(Ан, + р) 
5, =(Ех, -0”(ох,))®(Ет, -0*(оу,))” ОВ, =У2 (Ан, — 5.ь) 


2 


а ЕХ» | И’(ОХь) 
(?(ОУ,,) | Ч?(ОХ„)| ЕХ» 
ЕК, | И2(ОВ,) 

С учетом того, что необходимо 10 умножений для вычисления свертки разряд- 
НОСТЬЮ М=5 ‚ Далее показано, что достаточно 20 умножений для вычисления свертки 
разрядностью № =10=2.5. В этом случае предыдущие формулы принимают вид: 

А, = (Ех, +0?(ОХ,))® (ЕР, +0?(0У,)) ЕВ, =2(А,+5,) 


$, = (Ех, -0?(ох„))®(Еу, -0*(оу,)) ОЕ, =И2(4,-5,)' 


ОО.) | ’ОХь)! ЕХь 
ЕКу | И*(ОВ,) 


Из формул видно, ЧТО необходимо циклически сдвинуть нечетные элементы на 
две позиции и использовать всего две матрицы меньшей разрядности 
Е о м 
К ле $: д. 

2 
ЕХь =|х4 Хх № № № ‚ 0(ОХ,)= № № № № М 


Чо а. ога: Зе. 95 


[№ № № > Ж| [2 Хх № 2х № | 
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для представления свертки разрядностью № =10=2.5: 


Ул № № о № №№ Хз м № № 
У № ло № о № мам № Хз Хх № 
ЕТо Ум № м № №№ 2 х ХХ 
У | м № № №№ № ии ж Х: 
У № Хм № м М № А А8 
У | № %з м № Мм Ж % Хх № 
У | № № Хз №1 № Хз № № 
0*(07,) У | № хм № Хх Мл д % № № 
Ям № 4% № № Х4 х> № № 
У № м № № № № № Хх. Хх № 
п Г, 7. ВБ ПБ Г п в 
ЕКо 0?(ОК,) 


Рисунок 1 — Вычисление свертки длиной № =10 предложенным методом 


Таблица 3 — Количество операций умножения при вычислении свертки разряд- 
ностью №М=К.2”, и>1, где К =3, 5,7,9 


Количество операций Разрядность Количество операций 

Значения | умножения О" (К ) для свертки умножения О"(№ ) при 

К вычисления свертки №М=К.2”, вычислении свертки раз- 

разрядностью К и> 1 рядностью № = К й 2: и> 1 

Е : №М=3.2" О"(№)<8.3"" 

е 10 №М=5.2" 0'(№)<20.3"" 

г. 16 №М=7.2" 0'(№)< 32.3" 

9 19 №=9.2" О'(№)<38.3"" 


1.2 Построение алгоритмов умножения 
двух многоразрядных чисел 


№ 
Постановка задачи. Если целые положительные числа Их и Гу вида И’ =У и : 
50 
М№-1 | 
и = а где 0О<и,, у <2°, М= 2", тогда выражение ^А.»у вида 


1=0 
№МЬ—1 №МЬ—1 М-ЕМ- 2мМ-1 
а Е @ @ | __ @(1+7) (2) 
У о Е 
1=0 1=0 1=0 /= К=0 
представляет результат умножения двух многоразрядных чисел Их и Гу. 


Необходимо построить эффективные алгоритмы вычисления Ау. 


Реализация операции многоразрядного умножения с использованием ци- 
клической свертки. В качестве примера рассмотрим умножение двух чисел 
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И, = (ириьии, ‚И, = (», я ‚у, разрядностью 4 с использованием свертки. Алгоритм 


можно представить в виде: 


В, = (ии, и, и.,0,0,0,0) ® (0,0,0,0, ии, и мо). 


и 0 0 

и |0 

и. |0 

и |0 ъ 

О [ъ; ъ, 

О и 

Ору и 

Ох 0 
20: И 


7, 


Е 


7. 


У 


г. 


Рисунок 2 — Умножение в столбик 
двух чисел разрядностью 4 
с использованием свертки 


Рисунок 3 — Умножение в столбик двух 
чисел разрядностью 4 с использованием 
свертки с учетом нулевых строк 


На рис. 3, в отличие от рис. 2, учтено то, что умножение нулевых элементов из 


левого столбика на элементы матрицы дает в результате ноль. 


Окончательно получаем: 


и 

и 

и У; 

и У 
поп Г 


7. 


5 


о 


7 


из и и и 
У У У и 
ИУ, 1 ШУ ИУ 
ИУ ИУ ШУ И 
ИУ ИУ ИУ и 
ИУ ИУ ШУ И 
ПК г Г в Г й / 


Рисунок 4 — Умножение в столбик двух Рисунок 5 — Умножение двух чисел в столбик 
чисел разрядностью 4 с использованием 
свертки без нулевых строк 


Из рис. 4 и 5 видно, что использованная таким образом свертка реализует стан- 
дартный метод умножения в столбик, за исключением того, что результат получается в 
обратном порядке. 


№1 


Алгоритм 1. Реализация операции умножения двух М№ -разрядных чисел Ц, и и 


№-—1 


Г, = уз у,2°' ‚где @=8,16,32 ‚ с использованием свертки длиной 2М№: 


1=0 


Шаг 1. и, =0, 1=М№,2№М-1. 
Шаг 2. у: =У,, = О, М-1; у =0,1=М,2№М-1. 


Шаг3. Ау =Оу®И.х. 
Шаг 4. А, = А, (2М-1-В, 1=0,2№М-1 или (и) = (ри), 1=0,М-Т. 


0) 


719 


«Штучний 1нтелект» 32010 


`8-3_ Задирака В.К., Терещенко А.Н. 


Шаг 5. и = Ги, Иа =И, + НИ, 1=0,2№М-2. 


то о 


Вектор А. у, разрядностью 2М№ будет содержать результат операции умножения 
чисел Их и Г, разрядностью М№М. Операции [и и Ни обозначают, что берется 
младшая и старшая часть г, соответственно. 


Модифицированный диагональный метод, который использует рекуррент- 
ные соотношения и идею Карацубы-Офмана для умножения многоразрядных чисел, 
выражается следующим соотношением: 

=: №М-1 №М-—1 11 
И.Р, => 2%. 2 = Уи + (и, 2. (3) 
1=0 /=0 1 ]=0 

С учетом резервов оптимизации для первого слагаемого в (3) и максимального ис- 
пользования суммирования по диагонали на регистрах эта формула примет следующий вид: 

2м-—3 РЕ 
Ин-Г, =И, + >. И, + У (ии, У.) 2+, .,2°^>, 


1=0 


Т, =и у, 
= чим, =ЬМ-Т, 
Й' = И -и лу, ё=М2М-3 3. 
И’ м-> = Имам. (4) 


Формулы (3), (4) при № =2 совпадают с формулой Карацубы-Офмана [6]: 
1 1 
О, -Т, = Уи“ У у,2“ = им, + 02° +щу,2° +щу 2“? + (и, —и,)- ( —х 2 р 
1=0 1=0 
И» 7, = + (77, + (м, — и —и)2” +7, 27°, И, =и у, = +, И, = им. 
Априорные оценки сложности выполнения операции умножения М -разрядных 


чисел составляют 


3 


С) +3. т 
2“ > 


М-1, См +5 М-1, С МЕ М-. 


где С”(М№) — количество однословных операций умножения, С” (№) — количество двух- 
словных операций сложения, С`(М№) — количество однословных операций вычитания. 
Если все № разрядов в И, разбиваются на одинаковые числа, которые кодируют- 


[2 
ся блоками, то сумма ра (и И ‚ ЗУ) в (4) всегда будет равна нулю и количество 
1=0 


операций умножения будет линейно зависеть от длины множителя С”(№) =2М-2 и 


формула (4) примет вид: 
2№М-2 


[219 
— Уи, 2 › 
К=0 
И’, =иу, ; И’, ЕЙ’ +иу, , 1=ЬМ-1; И, = -иу,х, Е =М,2М -3; И, м, =иУ 
Очевидно, что если и Гу состоит из одинаковых по значению слов, то доста- 
точно только одной операции однословного умножения: С”(М№) =1. 


Если представить числа и и Г, в виде последовательности битов и существует 
ВОЗМОЖНОСТЬ разбиения на одинаковые по значению битовые последовательности мень- 
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шей длины, то в этом случае не обязательно разбивать И, и Г’ таким образом, чтобы 


длины таких меньших последовательностей совпадали по длине для каждого из раз- 
рядовв Их и Г, соответственно. 


Формулу (3) удобно использовать для случая, когда количество разрядов одно- 
го множителя кратно количеству разрядов другого множителя Их Гу, что значи- 


тельно уменьшает сложность выполнения многоразрядного умножения для такого случая. 

Умножение больших М№-разрядных чисел с вычислением только М№-раз- 
рядных ДПФ. При умножении двух М№ -разрядных чисел получается 2М -разрядный 
результат, поэтому необходимо вычислять 2М -разрядную свертку и соответственно 
2М№ -разрядные ДПФ множителей, которые рассматриваются как входные 2М -раз- 
рядные дискретные действительные сигналы. Далее приведен метод, при котором 
достаточно вычислять только М -разрядные ДПФ. Для этого приводятся формулы 
перехода от разрядности М№ к разрядности 2М№ и наоборот. Данный метод позволяет 
уменьшить число комплексных операций умножения приблизительно в два раза по 
сравнению со стандартным алгоритмом умножения с использованием БИФ, при 
котором необходимо вычислять все 2М№ значений свертки. 

Вначале приведем некоторые свойства ДИФ действительного сигнала, которые 
далее будут использоваться в данной статье [7]. 


^ и 
Лемма 4. Если Х› (г) и Х, (Г), Г=0, 2М -1 — действительный сигнал и его 


^ 


ДПФ, то Х(М+г) = Хо (М-Ю), г=Ь М-1, и Х,(М) - действительное число. 


Лемма 5. Если Х. (г), У (г) и Х,х(Г), У, (г), г=0, 2М-1 — действительные 


АХ ^ ^ ===: 
сигналы и их ДИФ соответственно, то сигнал 1/5 (7)= Хом(г). Ум (г), г=0, 2М-1, 
^ ^ 
обладает следующим свойством /5 (и) = т м@М№М-г), г=Ь М-1. 


Лемма 6 (формулы распаковки). Если (> у(г), г=0, 2М№ —1 — действительный 
сигнал, то ДИФ 4, (+) ` 4%, (+) сигналов И’ (г), г=0, 2М-1, и ЦИ (г)=ВБ/(г)+Ю (г) 


(Р.()=И.„@»), О(^)=И,(2++1), ‚= 0, М-1, связаны следующими соотношениями: 
6. „(М-›) = 6 ()- (№; 6,65) , "=Б МРТ, 6, (0) = Ве (0) + пи, (0). 
6, (№) = Ве (0) - ш&, (0), &,„(№/2) = @,(№/2). 
Лемма 7 (формулы упаковки). Если А, у(г), г=0, 2№М-1 — действительный 


сигнал, то ДПФ №,(^), №,(/) сигналов Ку(г)= Р. (г) +Ю,(Р) (Р.()= В, (25), 


Ох (г) = К, (2г) ), г=0, М-1, связаны следующими соотношениями 


Вов + у -5], = 
Ю,(№М-,) = В (г) +, (1) = М/Т; 
2 


(0) + ©. (№) ы Ю, ‚(0)- №, 


2 2 
Алгоритм 3. Приведем пошаговое описание алгоритма умножения двух /Л-раз- 
рядных чисел с вычислением только №-разрядных ДПФ. 


[6,6 -В,(-,| "=Ь м -, 


Е, (0) = 5 К (12) = (м). 
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Шаг 1. Добавить № старших нулей к сигналам Ох, Г, И’(г+М№) =И,(г+М)=0, 
г=0, М-1 и из полученных сигналов (›»у, Г›, сформировать сигналы Х’\(")=И (+ 
О (2+1), У (г) =И,@2° +1, (2"+1), г=0, М-1. 


Шаг 2. Вычислить ДПФ Х»(г), У,(г), г=0, М-1. 
Шаг 3. Перейти от разрядности М№ к разрядности 2М -распаковка. Вычислить 


М№-1 первые элементы Х, (г), У, у (г), г=0, № (Лемма 6). 
Шаг 4. Вычислить М№М+1 первые значения 2М -разрядной свертки 1, (г) = 


= Х, (2). (0) , "=0,М. 

Шаг 5. Перейти от разрядности 2М№ к разрядности М -упаковка. Вычисление 
Г. (+) из Г, (4) (Лемма7). 

Шаг 6. Вычислить ОДПФ Гу(г),г = 0, М-1. 

Шаг7. Найти искомый сигнал (И. (г), "= 0,2№-1 (результат умножения чисел 
0, (9, (®), г=0, №-1), используя выражения А, (2^)=Ве[ ()/М, К, (27-1) = Ша (к) /М, 
"=0, М-1. 

Тестирование проводилось согласно методике, описанной в [8] на процессоре 


Репнит ТУ 2.4 СН?2. 
С учетом того, что число комплексных операций умножения для вычисления 
А- и 2/№-разрядного ДПФ соответственно А» = №105, М и А, =2М№102, 2М№, найдем 
априорный коэффициент ускорения: 
5, _ 2№108,2М _ 2(108,2+102, М) Я 


ыы г =2+———. 
йе №105, № 105, № 105, № 


Таблица 4 — Результаты тестирования приведенного алгоритма по сложности 
по сравнению со стандартным алгоритмом на основе БИФ 


Кол-во Время вычисления, с Коэффициент 
байтов 2№ М№ ускорения 
384 14,06 5,687 2,472 
768 и 3,70 1,938 
1536 ЗЕ 1,78 2,118 
3072 2.054 0,97 2,118 


Для примера вычислим К при 3072 байтов. С учетом того, что предложенный 
алгоритм оперирует 3-байтовыми значениями, получаем 
2 
ЕН 
105, 1024 
В алгоритме использовались следующие резервы оптимизации вычислений: 
1. Таблица коэффициентов преобразования Фурье №/4 может быть уменьшена 


ото = , 


в два раза за счет того, что синусы матрицы вычисляются из косинусов. Достаточно 
хранить только косинусы в матрице, что уменьшает время работы с памятью. 

2. Мантисса сопроцессора используется только на треть при вычислении ДПФ ба- 
зовым методом на 32-битных процессорах, то есть один разряд ДПФ отвечает одному 
байту. Предлагается рассматривать 3 байта как один байт, что максимально использует 
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сопроцессор. Использование 64-битных процессоров дает возможность представлять 
один разряд свертки в 7 байтах и вычислять операции умножения 1024-битных чисел, 
используя всего лишь 32-разрядную циклическую свертку (7.8.32 = 1792 > 1024). 

3. Перегруппировка обрабатываемых данных улучшает быстродействие метода за 
счет увеличения операций последовательного доступа (ускорение на 11%). При этом 
элементы действительной и комплексной частей располагаются вместе, а не в отдель- 
ных массивах. 

4. Использование динамического распределения памяти увеличивает разрядность 
множителя до 6144 байт (ускорение на 20%). 


Таблица 5 — Коэффициенты ускорения Таблица 6 — Коэффициенты ускорения 
алгоритма Шенхаге-Штрассена по времени (с) алгоритма Шенхаге-Штрассена 
с базовым алгоритмом умножения по времени (с) с базовым алгоритмом 
до проведенной оптимизации умножения после проведенной 
оптимизации 
№ 166МГц 400Мгц № 166МГц | 400Мгц 
768 4.5 4.4 
512 16 8.2 1536 2.4 2 
1024 10 4.4 3072 1.6 1.4 
2048 5.5 2.3 6144 1.01 0.8 
4096 3.0 1.4 12288 0.7 0.4 
8192 1.7 0.75 24576 0.4 0.23 
16384 0.99 0.42 49115 0.23 0.13 
32768 0.56 0.23 98230 0.14 0.07 


Алгоритм умножения без умножения. Основное отличие предлагаемого ме- 
тода состоит в том, что при его реализации операция умножения не используется во- 
обще, а вычислительный процесс основывается только на сложении. Метод напоми- 
нает собой классический метод умножения в столбик. Для вычисления результата 
умножения используется таблица предвычислений из девяти элементов. Каждый 
элемент таблицы предвычислений равен первому множителю, умноженному на по- 
рядковый номер в таблице предвычислений. При нахождении результата происходит 
последовательная выборка разрядов второго множителя. Значения 1-го разряда соот- 
ветствуют номеру, по которому выбирается из таблицы предвычислений элемент, ко- 
торый прибавляется к результату, начиная с 1-го разряда. Нулевые разряды пропускаются. 

Для малого числа М, когда значения разрядов множителя повторяются редко, 
использование данного метода нецелесообразно. Этот метод применим при больших 
М№ . В этом случае вероятность появления цифры от 0 до 9 в каждом разряде прибли- 
зительно равна 10%. 

При практической реализации на ЭВМ необходимо учитывать, что большие числа 
рассматриваются как последовательность М байт, которые являются основной ячейкой 
памяти и могут содержать любые значения от 0 до 255. Так как для компьютера удобнее 
использовать 16-ричную систему исчисления, то байт лучше представить в виде двух 
16-ричных цифр (старшего и младшего). Тогда таблица Х\; будет иметь 15 элементов и 


процедуру получения произведения ^., можно разбить на два этапа. На 1-м этапе для 
умножения используются только младшие разряды всех байт числа Г. На втором этапе 
таблица Х,; переформатируется умножением каждого элемента на 16, что представляет 
собой сдвиг на 4 бита. Затем таблица Х,; используется для умножения старших раз- 


рядов всех байт числа Г’. 
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Алгоритм 5. Приведем пошаговое описание алгоритма умножения чисел ОИ и 


Г, ‚ каждое из которых содержит М№ байт (в = 8). 


№М-—1 - 
Шаг 1.Вычислить таблицу Х\;: Х\ = о. ;Х,=Х+Х1=2]5. 
/=0 
Шаг 2. Вычислить результат умножения числа И’, на младшие разряды числа 


№-—1 
Гу: К, = У Хи,,2” ‚где [у, — младшие разряды 1-го байта числа Гу. 


1=0 
Шаг 3. Корректировать таблицу Хх 15 ДЛЯ использования ее при получении результата 


умножения на старшие разряды числа Г’: ХМ =Х+Х\;; Х,=Х,,+Х,, [= 25. 


1 


Шаг 4. Найти результат умножения числа (И на младшие разряды числа Г’, : 
№-1 
@ . > 
Ку = уз Хх ( ну)2 ‚ где Ну,— младшие разряды 1-го байта числа Г’. 
1=0 


Накладные расходы для построения таблицы предвычислений при малых М№ го- 
раздо больше, чем остальные вычисления при обработке младших и старших разрядов. 

Приведем описание некоторых подходов, которые были использованы при чис- 
ленной реализации предложенного метода. 

1. Группировка операций чтения и записи в память. 

2. Использование двух таблиц. Расчет двух таблиц предвычислений для старшего 
и младшего разрядов и одновременное добавление элементов этих таблиц к результату. 

3. Использование кеша процессора. Последовательное добавление 1-го элемента таб- 
лицы предвычислений к результату, начиная с номеров разрядов второго множителя, в 
которых встречается значение 1, что позволяет максимально использовать кеш процессора. 

На медленных компьютерах наилучшей будет модификация, при которой 
используются одновременно две таблицы предвычислений для старшего и младшего 
разрядов каждого байта числа. При увеличении мощности компьютеров наилучшей 
оказывается модификация, при которой используется последовательное добавление 
1-го элемента таблицы предвычислений. 


Таблица 7 — Сравнительный анализ по быстродействию предложенных подходов по 
сравнению с диагональным методом на процессоре ОХ4-100 


№ 1-я модификация | 2-я модификация | 3-я модификация 
(группировка) (две таблицы) (кеш) 

64 8.00 1,55 3.00 

128 6,11 2,14 3,89 

256 4,50 2.04 3.76 

512 3,89 2,17 3,60 

1024 4,09 3,54 3,58 


Таблица 8 — Сравнительный анализ по быстродействию предложенных подходов по 


сравнению с диагональным методом на С@егоп 107 

№ 1-я модификация | 2-я модификация 3-я модификация 
(группировка) (две таблицы) (кеш) 

64 8,80 11,00 7.80 

128 5.07 6.29 4,93 

256 4.97 6.11 4.87 

512 4.68 6.03 4.62 

1024 4.56 6.09 4.64 
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С(№) <2М№* +30М№ +, (4М№? +91№) — оценка общего количества необходимых 
вычислительных затрат, где А, — коэффициент, который представляет соотношение 


времени выполнения операции чтения/записи в память и времени выполнения операции 
сложения для определенного класса компьютеров. Для процессоров типа Сеегоп, 


коэффициент А, >2. Тогда С(М№) <10№? +212М. 


1.3 Операция возведения в многоразрядную степень 
по многоразрядному модулю 


Постановка задачи. Если целые положительные числа (у, Гу, Ку, Му, Ту 


МЬ-1 | М-—1 | М1 | п-| | МЬ- : 
вида Е” ь а Е М, =» т,2“', У где 
1=0 1=0 1=0 1=0 1=0 
О<и,,у,г,т,,Е, < 2°, тогда выражение Г» вида 
М№М-1 


12° 
1=0 


№ 


К №МЬ-—1 | М- ) 
т, = (Ос, ) = || №2“ || Хм 
1=0 1=0 


Мх 


1 


представляет результат возведения многоразрядных чисел И», Г», в многоразряд- 
ную степень К»„ по многоразрядному модулю Му. 


Новая реализация алгоритма умножения Монтгомери. Алгоритм умножения 
Монтгомери используется для вычисления многоразрядного остатка и возведения в 
многоразрядную степень. Рассматривается новая реализация метода Монтгомери. 
В реализации введены и используются две системы сложных остатков, что позволяет 
использовать китайскую теорему об остатках. Вычисления происходят одновремен- 
но в двух системах остатков. 

Показано, что в алгоритме Монтгомери задачу нахождения остатка умножения 
двух М -разрядных чисел по М -разрядному модулю можно привести к нахождению 
остатка результата однословных умножений по однословному модулю, что позволяет 


ускорить этот метод. 
М№М-—1 
Лемма 8. Если модуль М = [м,, такой, что (т,,т,) =1, 1*/] и известны 
1=0 
М А: 
числа Й, , такие, что (п, -М,), =1, М, =—, (М‚,т,) =1, 1=0, М-1, то для любого 
7 т; 


числа ( < М верны следующие соотношения 
м м (ил, м 
и(или). Уна, > (ий), м м-м, 
1=0 | м м т, 1=0 | 


где (И) =и,,#=0,№М-1. 


Теорема 3 (переход из одной системы остаточных классов в другую). Пусть 
М№М-—1 М№-—1 
задано две системы остаточных классов т и т’ с модулями М = [", и М'= Ц т’, 
1=0 1=0 
такие, что (т,‚,т,;)=1, (т’,,т,) =1, {#1 и число И <М имеет следующие остатки: 
(и у =и,, 1=0, М -—1. Тогда сложность представления числа ( в системе остаточных 


: 1 
т 


«Штучний 1нтелект» 372010 725 


`8-3_ Задирака В.К., Терещенко А.Н. 


классов с модулем М ' ‚ где М <М | 5 выражается следующими априорными оценками: 
С'(№ < №+2М, С*(№М)<М, СО(№<2М, где С’(№), С*(№) - количества 


однословных операций умножения и деления, С (№ ) — число операций вычисления 
однословного модуля. 

Для алгоритма, приведенного ниже, необходимы предвычисления. 

При помощи расширенного алгоритма Евклида находим числа М' и О", 
такие, что М.М" -РО.Б"! =1. 

Представляем Ри О" в остатках 4, = (5), ат = (р), за = (р) 


1 


р 


т, 


Находим числа /,, й, ‚ такие, что (й.М,) =1, М, =М/т,, (М‚„т,) =1, (й-М,) =1, 


т, 
М; =М'т;, (М;,т;) =1, 1=0,М-1. 


Вычисляем матрицу И”' {и = (м ‚) „1 =0, М- 1}, используемую для перевода 


И 
промежуточного результата из системы остаточных классов т в систему классов и’. 
Также находим т, = (м), 51=0,№М-1. 


Аналогично вычисляется матрица И’ и, = (м 5 1=0,М-1Ц, используемая 


для обратного перевода промежуточного результата из системы классов т’ в систему 
классов т. Для этого также необходимо определить т”= (М " ‚ 1=0, М-1, пред- 


й 


ставляющий модуль М’ в системе остатков т,. 

Операцию деления на число М в системе остаточных классов т’ заменим 
умножением числа М”: ти” = (м) - (т/’ т) ‚=, т’ = (м), 5 1=0,М-1. 

т; т; т 
Найдем М -остатки чисел Пи Г 
(=(.мМ),Г={у.М),; 
тт ! тт тт [ т . м т 
к ы (0), 7 в ы (0), 2 У, ы (7). 2 и — И 7 " -- 0, М-1 у 
Алгоритм 5. Одновременное использование двух систем остаточных классов. 
Приведем пошаговое описание алгоритма. 


! ий ы 
Шаг 1. Вычислить {; = (им) в = (и) 5 1=0, М-1. 


Шаг 2. Вычислить $5, = (+аг) 


Ш 


‚1=0,№М-1. 


Шаг 3. Перейти в систему остаточных классов и’. 


Шаг За. Вычислить /. = (51,) 1 =0,№М-1. 
№-—1 © 
Шаг 36. Вычислить А = : уз ре 
20 те т, 
М№-—1 Ее 
Шаг Зв. Вычислить 5, = У», ря = (я - Аи!) =0,М-1. 
1-0 | 


Шаг 4. Вычислить #, = (#+ 4,5), Ё=0,М-1. 


' 
т 


Шаг 5. Вычислить # = (ит’) 


Шаг 6. Возвратиться в исходную систему остаточных классов т. 
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Шаг ба. Вычислить [= (ип) 5=0,№М-1. 


га 


Шаг 66. Вычислить А’ = 


Шаг 6в. Вычислить # = > и} „в = -Ёт», 1=0,М-1. 


й 


Шаг 7. Результат образуется в ячейках (1). де ‚1=0,№М-1. 


Теорема 4. Если числа (у и Г, М -разрядные, то количество операций в алгорит- 
ме 5 можно представить следующими априорными оценками: С”(№) <2М№° +9М, 
Сом, . (№) <9М, где С’(М№), С*(М№) - количество однословных операций 


умножения и деления, (© (№ ) — количество операций вычисления остатка по одно- 
словному модулю. 


2 Применение для решения прикладных задач 


В связи с ограниченным объемом статьи остановимся тезисно на некоторых при- 
ложениях, приведенных в п. 1 результатов. 

Первое, на что хотелось обратить внимание, это то, что предлагаемые выше 
алгоритмы являются новыми и, как показал сравнительный анализ, лучше известных 
алгоритмов на сегодняшний день по быстродействию. 

Второе — для каждого из алгоритмов получены конструктивные оценки (априор- 
ные и апостериорные) сложности, что позволяет произвести качественный сравнитель- 
ный анализ с ранее известными. 

Третье — хотя большинство из приведенных алгоритмов, за исключением моди- 
фикации алгоритма Монтгомери, осуществляют быстрое умножение многоразряд- 
ных чисел, учитывая, что возведение в степень состоит из операций умножения и возведения 
в квадрат, данные алгоритмы применимы и для решения этой более сложной задачи. 

Теперь относительно других приложений приведенных результатов. Существу- 
ет много классов задач вычислительной, прикладной и дискретной математики, для 
решения которых необходима техника вычислений, которая использует алгоритмы 
выполнения разных операций над многоразрядными числами. Среди таких задач 
можно указать задачи аппроксимации функций, моделирование физических, хими- 
ческих процессов, аэродинамики, гидродинамики, защиты информации и другие. 

В связи с увеличением сложности решаемых задач, например, систем линейных 
алгебраических сравнений с числом неизвестных 33 — 35 миллионов неизвестных, рас- 
чета оболочек ядерных реакторов, других высокоточных задач, для их решения необхо- 
димо применять современные компьютерные технологии с заданными характерис- 
тиками качества по точности и быстродействию [1]. С этой точки зрения, приведенные 
алгоритмы можно рассматривать как резерв оптимизации вычислений для достижения 
требуемого качества приближенного решения задачи (шаги 8— 17 компьютерной 
технологии решения задач прикладной и вычислительной математики с заданными 
значениями характеристик качества [1]). 

Необходимо также отметить необходимость включения библиотек программ, 
выполняющих операции над многоразрядными числами, в штатное математическое 
обеспечение современных многопроцессорных компьютеров, и создание соответ- 
ствующих программно-аппаратных комплексов [7]. 
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Выводы 


В статье изложены новые алгоритмы и их обоснование ДЛЯ быстрого ВЫПОЛ- 
нения операций над многоразрядными числами. Получены оценки сложности. 

Приведенные результаты находят применение при решении высокоточных за- 
дач, задач информационной безопасности, в математическом обеспечении современ- 
ных компьютеров. 
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В.К. Задрака, А.М. Терещенко 

Використання арифметики багаторозрядних чисел у сучасних комп’ютерних технолопях розв’язання 
задач трансобчислювально! складност! 

У робот! наводиться ряд оримнальних ефективних за швидкод!ею алгоритмв виконання операшй над 
багаторозрядними числами та 1х використання для розв’язання задач двоключово! криптографи 1 
високоточних обчислень за допомогою комп’ютерно! технологИ розв‘язання задач прикладно! 1 обчислю- 
вально! математики 13 заданими значеннями характеристик якост! за точн!стю та швидкодею. 


И.К. Хафгака, А.М. ТегезйсйепкКо 
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ТазК Зоуш? 

ТБе зеуега| ргосеззште зрее4 оЁ пи 1215 са1сШайоп а]еогил$ аге ргезетеа. | 15 зВо\уп Фе изше оЁ Фозе 
а]>огтл$ Юг зо[уше ‘азк$ оРмо-Кеу сгурюзтарВу апа В1-ргесляюп сасшайоп$ изте фе ‘а5К зоКлие сотрщег 
фесбтаие оРаррНе4 ап сотрийпе тафетайс$ у отуеп диаШу теазиге Бу ргес11юп ап ргосеззште зреед. 
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